智能论文笔记

Adaptive Gaussian Process based Stochastic Trajectory Optimization for Motion Planning

Feng Yichang , Zhang Haiyun , Wang Jin , Lu Guodong

分类：机器人

2021-12-30

我们为在危险环境中运行的机器人提供最佳运动规划（OMP）算法的新配方，称为自适应高斯过程的随机轨迹优化（AGP-STO）。它首先将加速梯度下降重新启动，通过重新定义的Lipschitz常数（L-REAGD）来提高计算效率，只需要第一个动量。然而，它仍然无法推断出于高斯过程（GP）和障碍物的先前信息的非耦合问题的全球最优。因此，它可以集成L-ReeStimation过程中的自适应随机轨迹优化（ASTO），以通过加速移动平均（AMA）来学习重要样本的GP先前奖励。此外，我们介绍了增量的最佳运动计划（IMPH），将AGP-STO升级到IAGP-STO。它在先前优化的航路点之间逐步地插入轨迹，以确保连续的安全性。最后，我们将IAGP-STO基于数值（CHOMP，TRAJOPT，GPMP）和采样（STOMP，RRT-CONNECT）方法，并进行关键参数的调整实验，以显示L-REAGD，ASTO和IOMP的集成如何提升计算效率和可靠性。此外，在LBR-IIWA，MULTI-AGV和RETHINK-BAXTER上实施IAGP-STO，证明其在操纵，协作和援助中的应用。

translated by 谷歌翻译

Incrementally Stochastic and Accelerated Gradient Information mixed Optimization for Manipulator Motion Planning

Yichang Feng , Jin Wang , Haiyun Zhang , Guodong Lu

分类：机器人

2021-08-21

本文介绍了一个新颖的运动计划者，逐渐随机和加速的梯度信息混合优化（ISAGO），用于狭窄的工作空间中的机器人操纵器。主要是，我们提出了由混合力量告知的Isago的整体方案，以根据惩罚方法进行有效的约束优化。在随机部分中，我们通过基于自适应动量（ADAM）方法的子功能的随机选择来生成自适应随机动量。由于随机部分的收敛缓慢，我们整合了加速梯度下降（AGD）以提高计划效率。此外，我们采用贝叶斯树推理（BTI）将整个轨迹优化（SAGO）转化为增量的亚trajectory优化（ISAGO），从而进一步提高了计算效率和成功率。最后，我们在书架上对LBR-IIWA上的其他5个计划者进行了关键参数和基准iSago，并在存储架上的Aubo-i5中调整了其他5个计划者。结果显示了iSago的最高成功率和中等解决效率。

translated by 谷歌翻译

Zero-Shot Rumor Detection with Propagation Structure via Prompt Learning

Hongzhan Lin , Pengyao Yi , Jing Ma , Haiyun Jiang , Ziyang Luo , Shuming Shi , Ruifang Liu

分类：自然语言处理

2022-12-02

The spread of rumors along with breaking events seriously hinders the truth in the era of social media. Previous studies reveal that due to the lack of annotated resources, rumors presented in minority languages are hard to be detected. Furthermore, the unforeseen breaking events not involved in yesterday's news exacerbate the scarcity of data resources. In this work, we propose a novel zero-shot framework based on prompt learning to detect rumors falling in different domains or presented in different languages. More specifically, we firstly represent rumor circulated on social media as diverse propagation threads, then design a hierarchical prompt encoding mechanism to learn language-agnostic contextual representations for both prompts and rumor data. To further enhance domain adaptation, we model the domain-invariant structural features from the propagation threads, to incorporate structural position representations of influential community response. In addition, a new virtual response augmentation method is used to improve model training. Extensive experiments conducted on three real-world datasets demonstrate that our proposed model achieves much better performance than state-of-the-art methods and exhibits a superior capacity for detecting rumors at early stages.

translated by 谷歌翻译

What would Harry say? Building Dialogue Agents for Characters in a Story

Nuo Chen , Yan Wang , Haiyun Jiang , Deng Cai , Ziyang Chen , Longyue Wang , Jia Li

分类：自然语言处理 | 人工智能

2022-11-13

We have a Christmas gift for Harry Potter fans all over the world. In this paper, we present Harry Potter Dialogue (HPD), a dataset that helps train Harry Potter-like dialogue agents. Such a task is typically viewed as a variant of personalized dialogue agents, but they differ significantly in three respects: 1) Harry lived in a virtual world of wizards, thus, real-world commonsense may not apply to Harry's conversations; 2) Harry's behavior is strongly linked to background information in conversations: the scene, its attributes and its relationship to other speakers; and 3) Such backgrounds are dynamically altered as the storyline goes on. The HPD dataset, as the first dataset to facilitate the study of dialogue agent construction for characters within a story, provides rich contextual information about each dialogue session such as scenes, character attributes, and relations. More importantly, all the background information will change over the course of the story. In addition, HPD could support both dialogue generation and retrieval tasks. We evaluate baselines such as Dialog-GPT and BOB to determine the extent to which they can generate Harry Potter-like responses. The experimental results disappoint us in that although the generated responses are fluent, they still seem out of character for Harry. Besides, we validate the current most robust dialogue agent, ChatGPT, which also can't generate plausible Harry-Potter-like responses in some cases, either. Our results suggest that there is much scope for future research.

translated by 谷歌翻译

A Novel Semi-supervised Meta Learning Method for Subject-transfer Brain-computer Interface

Jingcong Li , Fei Wang , Haiyun Huang , Feifei Qi , Jiahui Pan

分类：人工智能 | 机器学习

2022-09-07

大脑计算机界面（BCI）提供了人脑和外部设备之间的直接通信途径。在新受试者可以使用BCI之前，通常需要进行校准程序。因为间和受试者内部的差异是如此之大，以至于由现有受试者训练的模型在新受试者方面的表现不佳。因此，有效的主题转移和校准方法至关重要。在本文中，我们提出了一种半监督的元学习（SSML）方法，用于BCIS的主题转移学习。拟议的SSML首先学习了具有现有受试者的元模型，然后以半监督的学习方式对模型进行微调，即使用很少的标记和许多未标记的目标对象样本进行校准。对于标记数据稀缺或昂贵的同时，无标记数据的BCI应用程序非常重要。为了验证SSML方法，测试了三种不同的BCI范例：1）与事件相关的潜在检测； 2）情绪识别； 3）睡眠舞台。 SSML在前两个范式上取得了显着提高15％，而第三个范式则达到4.9％。实验结果证明了SSML方法在BCI应用中的有效性和潜力。

translated by 谷歌翻译

Effidit: Your AI Writing Assistant

Shuming Shi , Enbo Zhao , Duyu Tang , Yan Wang , Piji Li , Wei Bi , Haiyun Jiang , Guoping Huang , Leyang Cui , Xinting Huang

分类：自然语言处理

2022-08-03

在这份技术报告中，我们介绍了数字写作助手（高效且智能编辑），该助手通过使用人工智能（AI）技术来促进用户更有效地编写更高质量的文本。以前的写作助理通常提供错误检查的功能（以检测和纠正拼写和语法错误）和有限的文本练习功能。随着大型神经语言模型的出现，一些系统支持自动完成句子或段落。在Effidit中，我们通过提供五个类别的功能来显着扩展写作助手的能力：文本完成，错误检查，文本抛光，关键字到句子（K2S）和云输入方法（Cloud IME）。在文本完成类别中，Effidit支持基于生成的句子完成，基于检索的句子完成和短语完成。相比之下，到目前为止，许多其他写作助理仅提供三个功能中的一两个。对于文本抛光，我们具有三个函数：（上下文感知）短语抛光，句子释义和句子扩展，而其他许多写作助手通常会在此类别中支持一两个功能。本报告的主要内容包括象征的主要模块，实施这些模块的方法以及一些关键方法的评估结果。

translated by 谷歌翻译

FL-Tuning: Layer Tuning for Feed-Forward Network in Transformer

Jingping Liu , Yuqiu Song , Kui Xue , Hongli Sun , Chao Wang , Lihan Chen , Haiyun Jiang , Jiaqing Liang , Tong Ruan

分类：自然语言处理 | 机器学习

2022-06-30

及时调整是将预训练的语言模型调整为下游任务的一种新兴方法。但是，现有的研究主要是为输入序列增加提示。由于中间多头自我注意和馈送网络计算，因此这种方式无法正常工作，从而使模型优化不是很好。因此，我们提出了一种称为“图层调整”的新颖调整方式，旨在在变压器层中添加可学习的参数。具体而言，我们专注于变压器中的馈电网络的图层调整，即FLANing。它将其他单元引入每个馈送网络的隐藏层。我们对公共线索基准进行了广泛的实验。结果表明：1）在几乎所有情况下，我们的FL-tuning tospormports促进了全数据和少量设置下的调整方法。特别是，它在WSC 1.0上的准确性提高了17.93％（全数据设置），而F1上的精度则提高了P-Tuning V2上的Cluener上的精度（几乎没有射击设置）。 2）我们的FL-调整更稳定，收敛速度比P-Tuning V2快约1.17倍。 3）只有大约3％的变压器参数要训练，因此在大多数数据集中进行了微调，并且在几个数据集上的微调（例如，WSC 1.1上的准确性提高了12.9％）。源代码可从https://github.com/genggui001/fl-tuning获得。

translated by 谷歌翻译

Plug-and-Play Pseudo Label Correction Network for Unsupervised Person Re-identification

Tianyi Yan , Kuan Zhu , Haiyun guo , Guibo Zhu , Ming Tang , Jinqiao Wang

分类：计算机视觉

2022-06-14

基于聚类的方法，在伪标签的产生和特征提取网络的优化之间交替，在无监督学习（USL）和无监督的域自适应（UDA）人重新识别（RE-ID）中起着主要作用。为了减轻嘈杂的伪标签的不利影响，现有方法要么放弃不可靠的标签，要么通过相互学习或标签传播来完善伪标签。但是，仍然积累了许多错误的标签，因为这些方法主要采用传统的无监督聚类算法，这些算法依赖于对数据分布的某些假设，并且无法捕获复杂的现实世界数据的分布。在本文中，我们提出了基于插件的伪标签校正网络（GLC），以以监督聚类的方式完善伪标签。训练GLC可以通过任何聚类方法生成的初始伪标签的监督来感知自训练的每个时期的不同数据分布。它可以学会通过K最近的邻居（KNN）图和早期训练策略的样本之间的关系约束来纠正初始嘈杂标签。具体而言，GLC学会从邻居汇总节点特征，并预测是否应在图上链接节点。此外，在对嘈杂的标签进行严重记忆以防止过度拟合嘈杂的伪标签之前，GLC已通过“早停”进行了优化。因此，尽管监督信号包含一些噪音，但GLC提高了伪标签的质量，从而可以更好地进行重新ID性能。在Market-1501和MSMT17上进行了USL和UDA人重新ID的广泛实验表明，我们的方法与各种基于聚类的方法广泛兼容，并始终如一地促进最先进的性能。

translated by 谷歌翻译

PASS: Part-Aware Self-Supervised Pre-Training for Person Re-Identification

Kuan Zhu , Haiyun Guo , Tianyi Yan , Yousong Zhu , Jinqiao Wang , Ming Tang

分类：计算机视觉

2022-03-08

在亲自重新识别（REID）中，最近的研究已经验证了未标记的人图像上的模型的预训练要比ImageNet上要好得多。但是，这些研究直接应用了为图像分类设计的现有自我监督学习（SSL）方法，用于REID，而无需在框架中进行任何适应。这些SSL方法将本地视图的输出（例如红色T恤，蓝色短裤）与同时的全球视图相匹配，从而丢失了很多细节。在本文中，我们提出了一种特定于REID的预训练方法，部分意识的自我监督预训练（PASS），该方法可以生成零件级别的功能以提供细粒度的信息，并且更适合REID。通行证将图像分为几个局部区域，每个区域随机裁剪的本地视图都有特定的可学习[部分]令牌。另一方面，所有地方区域的[部分]也附加到全球视图中。通行证学习以匹配同一[部分]上本地视图的输出和全局视图。也就是说，从本地区域获得的本地视图的[部分]仅与从全球视图中学到的相应[部分]相匹配。结果，每个[部分]可以专注于图像的特定局部区域，并提取该区域的细粒度信息。实验显示通行证在Market1501和MSMT17上的新最先进的表演以及各种REID任务（例如Vanilla vit-s/16）通过Pass Achieves 92.2 \％/90.2 \％/88.5 \％地图准确性，例如Vanilla vit-s/16在Market1501上进行监督/UDA/USL REID。我们的代码可在https://github.com/casia-iva-lab/pass-reid上找到。

translated by 谷歌翻译

Rethink Stealthy Backdoor Attacks in Natural Language Processing

Lingfeng Shen , Haiyun Jiang , Lemao Liu , Shuming Shi

分类：自然语言处理 | 机器学习

2022-01-09

最近，已经表明，自然语言处理（NLP）模型容易受到一种称为后门攻击的安全威胁，它利用“后门触发器”范例误导模型。最威胁的后门攻击是隐身的后门，它将触发器定义为文本样式或句法。虽然他们已经取得了令人难以置信的高攻击成功率（ASR），但我们发现为ASR的主要因素贡献不是“后门触发”范式。因此，当作为后门攻击分类时，这些隐身后门攻击的能力大得多。因此，为了评估后门攻击的真正攻击力，我们提出了一种称为攻击成功率差异（ASRD）的新度量，从而测量干净状态和毒药状态模型之间的ASR差异。此外，由于对抗隐蔽的后门攻击的防御，我们提出了触发破坏者，包括两个太简单的技巧，可以有效地防御隐秘的后门攻击。关于文本分类任务的实验表明，我们的方法比对隐身后门攻击的最先进的防御方法实现了更好的性能。

translated by 谷歌翻译